1. Identificação | |
Tipo de Referência | Vídeo em Evento (Audiovisual Material) |
Site | mtc-m16c.sid.inpe.br |
Identificador | 8JMKD3MGPDW34P/43HC39E |
Repositório | sid.inpe.br/mtc-m16c/2020/11.05.16.41 |
Última Atualização | 2020:11.05.16.41.12 (UTC) simone |
Repositório de Metadados | sid.inpe.br/mtc-m16c/2020/11.05.16.41.12 |
Última Atualização dos Metadados | 2021:09.16.19.16.55 (UTC) simone |
Chave de Citação | SilvaJúnior:2020:AbInCi |
Título | O KNN e o desafio do Titatnic: uma abordagem introdutória da ciência de dados |
Formato | On-line. |
Ano | 2020 |
Data de Acesso | 15 maio 2024 |
Tipo Secundário | PRE CN |
Número de Arquivos | 1 |
Tamanho | 23906 KiB |
|
2. Contextualização | |
Autor | Silva Júnior, Antonio Carlos da |
Afiliação | Universidade Federal do Paraná (UFPR) |
Endereço de e-Mail do Autor | juniorssz@gmail.com |
Nome do Evento | Workshop dos Cursos de Computação Aplicada do INPE, 20 (WORCAP) |
Localização do Evento | São José dos Campos |
Data | 8-11 e 14-17 set. 2020 |
Editora (Publisher) | Instituto Nacional de Pesquisas Espaciais (INPE) |
Cidade da Editora | São José dos Campos |
Título do Livro | Vídeos |
Tipo Terciário | palestra |
Histórico (UTC) | 2020-11-09 17:35:27 :: simone -> administrator :: 2020 2020-11-26 14:06:24 :: administrator -> simone :: 2020 2020-11-27 17:53:41 :: simone -> administrator :: 2020 2021-03-29 22:55:28 :: administrator -> simone :: 2020 |
|
3. Conteúdo e estrutura | |
É a matriz ou uma cópia? | é a matriz |
Estágio do Conteúdo | concluido |
Transferível | 1 |
Resumo | A ciência de dados é uma área de estudo multidisciplinar que tem se tornado cada vez mais popular entre as empresas de todo o planeta. Esta área tem como principal objetivo a extração de informações relevantes à partir de dados brutos, visando o melhor apoio à tomada de decisão. Esta ciência lida com técnicas estudadas há décadas, que vem ganhando destaque nos últimos anos em virtude do aumento da capacidade computacional para o processamento de um grande volume de dados que tem praticamente dobrado a cada ano. Estes dados são obtidos a partir de diversas fontes, como bancos de dados transacionais, redes sociais e dispositivos IOT, por exemplo. Contudo, eles necessitam de alguma intervenção profissional para a detecção e a eliminação de inconsistências, de modo a possibilitar as melhores e mais confiáveis análises. Dada a popularidade da ciência de dados entre as empresas e a dificuldade de se formar um profissional com boa capacitação nos pilares da ciência da computação, estatística / matemática e conhecimento de negócio, a demanda pelo cientista de dados no mercado de trabalho tem aumentado cada vez mais e, em consequência, o interesse pelo ingresso nesta nova profissão tem sido cada vez maior. O desafio do Titanic, promovido pela Kaggle que é uma plataforma que hospeda competições de ciência de dados, normalmente é a porta de entrada dos aspirantes a cientista de dados para o mundo da modelagem preditiva. No entanto, a falta dos recursos adequados para lidar com a etapa de preparação dos dados acaba comprometendo o sucesso da análise. Portanto, a proposta deste trabalho é uma abordagem por meio do conjunto de dados do desafio do Titanic, ao qual será demonstrada a etapa de tratamento e preparação dos dados com a utilização da linguagem de alto nível R apoiada pelo algoritmo KNN para a imputação de dados ausentes. Com a aplicação destas técnicas, além da obtenção de um conjunto de dados lapidado para aplicação da análise preditiva requerida pelo desafio, pode-se constatar que a abordagem é viável e plausível para ser aplicada em situações do mundo real, uma vez que os dados obtidos pelas empresas, mesmo em contexto e dimensões diferentes, muitas vezes são apresentados de forma semelhante. Este estudo tem o propósito de mostrar de maneira lúdica a importância de uma boa análise exploratória e do tratamento dos dados levantados, podendo assim auxiliar a Academia em estudos futuros, bem como orientar e incentivar os novos profissionais. |
Área | COMP |
Tipo | tecnologia da informação |
Arranjo 1 | urlib.net > BDMCI > Fonds > WORCAP > O KNN e... |
Arranjo 2 | urlib.net > BDMCI > Fonds > WORCAP > XX WORCAP > O KNN e... |
Arranjo 3 | urlib.net > BDMCI > Fonds > Produção anterior à 2021 > LABAC > XX WORCAP > O KNN e... |
Conteúdo da Pasta doc | acessar |
Conteúdo da Pasta source | não têm arquivos |
Conteúdo da Pasta agreement | não têm arquivos |
|
4. Condições de acesso e uso | |
URL dos dados | http://urlib.net/ibi/8JMKD3MGPDW34P/43HC39E |
URL dos dados zipados | http://urlib.net/zip/8JMKD3MGPDW34P/43HC39E |
Idioma | pt |
Arquivo Alvo | KNN e desafio do Titanic_ Abordagem introdutória da ciência de dados - Antonio C. da Silva Jr.mp4 |
Grupo de Usuários | simone |
Visibilidade | shown |
Licença de Direitos Autorais | urlib.net/www/2012/11.12.15.03 |
Permissão de Leitura | allow from all |
Permissão de Atualização | não transferida |
|
5. Fontes relacionadas | |
Repositório Espelho | iconet.com.br/banon/2005/09.28.12.40 |
Unidades Imediatamente Superiores | 8JMKD3MGP8W/38ELNHL 8JMKD3MGPDW34P/43LA7CL |
Lista de Itens Citando | sid.inpe.br/mtc-m16c/2020/11.23.17.27 2 |
Acervo Hospedeiro | sid.inpe.br/mtc-m18@80/2008/03.17.15.17 |
|
6. Notas | |
Notas | (15 min) |
Campos Vazios | archivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi e-mailaddress group holdercode isbn issn keywords label lineage mark nextedition numberofslides orcid parameterlist parentrepositories previousedition previouslowerunit progress project readergroup resumeid rightsholder schedulinginformation secondarydate secondarykey secondarymark session shorttitle sponsor subject tertiarymark url versiontype volume |
|
7. Controle da descrição | |
e-Mail (login) | simone |
atualizar | |
|